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(54) Title: DATA-CONVERSION METHOD 

(54) Bezeichnung: VERFAHREN ZUR DATENKONVERTIERUNG 
(57) Abstract 

The invention concerns a method of converting data between two 
applications or software packages which use different data formats. A 
fundamental problem in data-processing today is the combination and exchange 
of source data from different software packages. Intelligent conversion 
software predominantly uses data structures of data bases and data-processing 
equipment. Proceeding from a first recognition of a rough structure, the file 
form is prc-classificd in conversion tools. The conversion software provides an 
algorithm set by means of which the fine structure is automatically recognized 
and converted. The analysis of model files of applications A and B is continued 
as far as the substructure level, the source data finally being converted by means 
of the analysis into the target data which arc imported by application B. 

(57) Zusammenfassung 



Es wird ein Verfahren zur Konvertiemng von Daten zwischen zwei 
Anwendungen bzw. Softwarepaketen vorgcschlagcn, die zueinander untcr- 
schiedtiche Datenfomiatc benutzen. Alscin Grundproblem der heutigen Daten- 
verarbcitung isi dabei das Zusammenfilhren und der Austausch von Datcn- 
quellen verschiedencr Softwarepakete erkannt worden. FtJr einc intelligente 
Konvertierungssoftware werden in crster Linie Datcnstrukturen von Daten - 
banken und Datenverarbeitungsanlagen bctrachtct. Ausgehend von dem ersten 
Erkennen^einer Grobstruktur wird die Date i form in Konvertieningstools vork- 
lassifiziert. Die Konvertierungssoftware stellt cinen Satz von Algoriihmen zur 
Verfiigung, wodurch automatisch die Feinstruklur erkannt und umgcwandelt 
wird. Die Analyse von Vorlage files der Anwendungen A und B wird bis in 
die Substrukturcn fortgeftihrt, wobei letztendlich die Quelldalen mit Hilfe der Analyse in die Zieldaten konverticrt werden, welche von der 
Anwendung B importiea werden. 




LEDIGUCH ZUR INFORMATIOS 



Codes zur Idcntifizierung von PCT-Vcrtragsstaatcn auf den Kopfbdgen dcr Schriften. die intcmalionale Anmcidungen gcmSss dem 
PCT vcroffentlichen. 



AL 


Albanicn 


ES 


Spanicn 


LS 


I^sotho 


SI 


Stowenicn 


AM 


Armenicn 


Fl 


Finn land 


LT 


Liiaucn 


SK 


Slowakei 


AT 


Ostcrrckh 


FR 


Frankreich 


LU 


Luxemburg 


SN 


Senegal 


AU 


Austntlien 


GA 


Gabun 


LV 


Leitiand 


SZ 


Swasiland 


AZ 


Ascrbaidschan 


CB 


Veretnigies KOnigrcich 


MC 


Monaco 


TD 


Tschad 


DA 


Dosnien-Henegowina 


GE 


Gcorgien 


MO 


Republik Moldau 


TG 


Togo 


BD 


Barbados 


GH 


Gbaru 


MC 


Madagaskar 


TJ 


Tadschikisfan 


DE 


Bclgien 


GN 


Guinea 


MR 


Die ehenialigc jugoslawischc 


TM 


Turkmenistan 


UK 


Burkina Faso 


GK 


Gricchenland 




Republik Mazcdonicn 


TR 


TQrkei 


BG 


Bulgarien 


HU 


Ungam 


ML 


Malt 


TT 


Trinidad und Tobago 


DJ 


Benin 


IE 


Irland 


MN 


Mongolei 


UA 


Ukraine 


BR 


Drasilien 


IL 


Israel 


MR 


Mauretanien 


UG 


Uganda 


BY 


Belarus 


IS 


Island 


MW 


Malawi 


US 


Vcrcinigtc Siaaien von 


CA 


Kanada 


IT 


Italicn 


MX 


Mexiko 




Amcrika 


CF 


Zentralafrikanisch£ Republik 


JP 


Japan 


NE 


Niger 


UZ 


Usbckisian 


CC 


Kongo 


KE 


Kenia 


NL 


Niedcrtande 


VN 


Vtelnam 


CH 


Schweiz 


KG 


Kirgisistan 


NO 


Norwcgen 


YU 


Jugoslawten 


CI 


C4l«c d' I voire 


KP 


Dcmokratischc Volksrcpublik 


NZ 


Neusccland 


zw 


Zimbabwe . 


CM 


Kamcnin 




Korea 


PL 


Polen 






CN 


China 


KK 


Republik Korea 


PT 


Portugal 






CU 


Kuba 


KZ 


Kasschsian 


RO 


RumAnien 






cz 


Tschechische Republik 


LC 


Sf. Lucia 


RU 


Russische FOderaiion 






DE 


DeutscMand 


LI 


Liechtenstein 


SD 


Sudan 






DK 


D&ncmark 


LK 


Sri Lanka 


SE 


Schwcden 






EE 


Bsiland 


LR 


Liberia 


SG 


Singapur 







BNBOOaD: <W0_fl73eaBttM JL> 



INTERNATIONAL SEARCH REPORT 



(nten. nal Application No 

PCT/EP 97/01442 



A. CLASSIFICATION OF SUBJECT MATTER 

IPC 6 GO6F17/30 






Acconlins Co IniemationAJ Patent aassfication (IPC) or to both naoonal claaiftcaQon and IPC 




B. FIELDS SEARCHED 


Mtmmum documcnution searched (clasnftcaoon system followed by clasaficaoon symbols) 

IPC 6 G06F 


Documcnution searched other than minimum documenuuon to the extent that such documents are mcluded m the fields searched 


Electronic d 


au base consul ud durmg the mumabonal search (name of daU base and, where pracocai. search terms used) 




C. DOCUMENTS CONSIDERED TO BE RELEVANT 


Catcfory * 


Ouoon of document, with indication, where appropnate, of the relevant passages 


Relevant to claim No. 


A 


EP Q 449 494 A (IBM) 2 October 1991 
see abstract 

see page 3, column 1, line 1 * page 4, 
column 4, line 22 


1-11 


A 


US 5 119 465 A (JACK MARTIN L ET AL) 2 
June 1992 

see abstract; figure 1 


1-11 


A 


EP 0 13G 375 A (IBM) 9 January 1985 
see abstract 

see page 2» line 8 - page 2, line 34 


1-11 


1 j Further documents are listed in the continuaQon of box C. 


jj^ 1 Patent family members are listed in annex. 


* Spcaal categoncs of a led documents : 

'A' document dcfinuiK the general state of the art which is not 
considered to be of particular relevance 

'E' ca/lter document but published on or afUr the international 
filing date 

'L' document which may throw doubts on pnonty claim<s) or 
which IS ated to esuMish the publication date of another 
atition or other special reason (as xpcafied) 

'O' doctiment referring to an oral disclosure, use* exhibition or 
other means 

^P' document published prior to the intemationaj filing date but 
" later than the priority date claimed 


T' later document published aAer the mtemationai filing daU 
or priority date and not in conflict with the application but 
ated to understand the principle or theory underlying the 
invenoon 

'X' document of particular relevance; the d aimed invention 
cannot be considered novel or cannot be considered to 
mvotve an inventive step when the document is taken alone 

'Y' document of paincular relevance; the claimed invenaon 
caimot be considered to involve an inventive step when the 
document is combined with otk or more other such docu- 
ments, such combination being obvious to a person stalled 
in the an. 

document member of the same patent family 


Date of the actual completion of the international search 

11 July 1997 


Date of mailing of the international search report 

2 2.07.97 


Name axtd mailing address of the ISA 

European Patent Office, P.B. S81S PaUnUaan 2 
NL - 23SO HV Riitwijk 
Tel. ( + 31-70) 340.2040. Tx. 31 6$l epo nl. 
Fax 31-70) 340-3016 


Authorized officer 

Katerbau, R 



fcm PCT.'ISA'IIO litcoAd theel) (July 1993) 



inte: 



ONAL SEARCH REPORT 

lUoh on patent funily monbcri 



Patem documcni 
cited in se&rch report 

EP 0449494 A 



Publication 
dale 

02-10^91 



CA 
JP 
KR 
US 
US 



Patent family 
mefnber(s) 

2034905 A 
4223538 A 
9616882 B 
5416917 A 
5566332 A 



onMi Applicauon No 

/EP 97/ 01442 

Publication 
date 

28-09-91 

13-08-92 
26-12-96 
16-05-95 
15-10-96 





A 


02-06-92 


NONE 




EP 0130375 


A 


09-01-85 


US 4559614 A 
JP 1746325 C 
JP 4034782 B 
JP 60015739 A 


25- 03-93 
09-06-92 

26- 01-85 



Form PCT/ISA'310 fpMMt ftmily •«»«) {Mt i^fl] 



INTERNATION 



RECHERCHENBERICHT 



(nte. .oxuXcs Aktenzachcn 

PCT/EP 97/01442 



A. KLASSIFIZIERUNG OES ANMELOUNGSGECENSTANDES 

IPK 6 G06F17/3O 



Nach dcr IntcrnAtionaJai PatcntkiatgfikAaon (IPK) oder nach dcr naoonalcn Klassirikaoon und der IPK 



B. RECHERCHIERTE GEBIETE 



Rcchcrchicrtcr Mindestpnifstofr (KJasnfikationsystem und Kiasafikanonisymbolc ) 

IPK 6 G06F 



Rcchcrchictte abcr njchl zum Mindestprufstoff schortndc Vcroffcntlichungen, wweit dicse tinter die rcchcrchi cnen Gcbicu fallen 



Wahrcnd der intcmaQonalcn Recherche konndtieru eleklronitche Oaunbank (Name der Datenbank and evU. vcrwendeu Suchbegnffe) 



C. ALS WESENTLtCH ANCESEHENE UNTERLAGEN 



KaUfone' Baachnung der Verorfcntltchuns^ sowat erfordcrbch unter Angabe der tn Bctracht kommcndcn Tdle 



Betr. Anspruch Nr. 



EP 0 449 494 A (IBM) 2-Oktober 1991 
siehe Zusamnenfassung 
siehe Seite 3, Spalte 1, Zeile I - Seite 
4. Spalte 4, Zeile 22 

US 5 119 465 A (JACK MARTIN L ET AL) 
2.Jum' 1992 

siehe Zusamnenfassung; Abbildung 1 

EP 0 130 375 A (IBM) 9.Januar 1985 
siehe Zusamnenfassung 

siehe Seite 2, Zeile 8 - Seite 2. Zeile 34 



1-11 



1-11 



1-11 



□ 



Weitere Vcroffentlichungcn and der Fortsecung von Feld C zu 
cntnehmen 



0 



Siehe Anhang Patcntfamilie 



Bcsondcrc Kategonen von angcgebenen Vcrorfentlichungcn 
A' Vcnofrentlichung. die den aUgemeinoi Stand der Technik definiert. 



E' 



aber nichi aJs bcsonden bedeutsam anzuschen m 

i^*^^ «^ «m od<r nach dem inumabonaJen 
Anmcldcdatum vcrbrrentlicht worden ifi 



L VeroffentJichung, die geeignct «t, einen PrionUtsanspruch zweifdhaft er- 
tcheinen zu laacn. Oder durch die das Veroffendichunpdanim ciner 
anderen im Recherchenfoericht genanncen Veroffentlichung belegt werden 
wll Oder die aus einem anderen bcsonderen Grtind angcgeben isc (wie 
ausgcfuhrt) * 
VeroffenUichung, die «ch auf one mundliche Orfenbarung, 
einc Benucung. erne Autstdlung Oder andcre MaOnahmen bcaeht 
VeroffenUichung, die vor dem intemaOonaJen Anmeldcdatum, aber nach 
dem bcansjimjchun PrionUtsdaium veroffendiehi worden lA 



T Spatere Veroffentlichung, die nach dem inicmationalcn Anmddedatum 
Oder dem Pnontaudatum veroffentlicht worden ist und mil der 
Anmeldung nicht kolhdiert, sondcm nur zumVerstandnis des der 
Erfmdung zugnmdeltegenden Prmzips oder der ihr zugrundehesenden 
Tbeone angcgeben ijt m- • 

*X* Verbffentltchung von bctondcrer Bcdeutung; die bcantpmchte Erfmdung 
kann allem aufgnind dieser VerofTendichung nichl alt neu oder auf 
crfindenscher Tatigkeit beruhend betrachtet werden 

*Y* VerbfTcnUichung von besonderer Bedeutunc die beanspruchte Erfmdung 
kann mcht als auf erfindcrucher Tatigkeit beruhend betrachtet 
werden, wenn die Veroffcntlichung mit «ner oder mchfcren anderen 
Verbffentlichungen dic«r KaUgone in Verbtndung gebracht wird und 
diese Verbindung fur einen Fachmann nahehegena ist 
Veroffendichung, die Mitglied derrelbcn Patentfamitie ist 



Datum des Abschlusses der intemabonaJen Recherche 



ll.Juli 1997 



AtBcndedaDim dct inicmalionalcn Recherchcnbenchcs 



2 2. 0197 



Name und Portanwrhnft der Intemaoonale Recherchenbehorde 
Europaisches Pauniamt, P.B. SSI 8 PatenUaan 2 
NL . 2280 HV Riiswijk 
TeJ. ( * 31.70) 340- 2040. Tx. 31 651 epo ni, 
Fax: ( «• 31-70) 340-3016 



Bevollmachogtcr Rediemtcter 



Katerbau; R 



Fonnblau PCT/ISA'aiO (BUa 2) <JuU 1993) 



INTERNAHON 

Angaben zu VtrbfrenUichungei^ 



RECHERCHENBERICHT 

zur sclbcn P*ientf*nulie teh6r«n 



Ir^^ an»lu Akienznctien 

W/^P 97/01442 




Im Recherchenberichl 
angefiihrtei Paienulokumeni 



EP 0449494 A 



02-10-91 



CA 
JP 
KR 
US 
US 



2034905 A 
4223538 A 
9616882 B 
5416917 A 
5566332 A 



28-09-91 
13-08-92 
26-12-96 
16-05-95 
15-10-96 





02-06-92 


KEINE 




EP 0130375 A 


09-01-85 


JP 1746325 C 
JP 4034782 B 
JP 60015739 A 


25- 03-93 
09-06-92 

26- 01-85 



Formblcll 



wo 97/36250 



PCT/EP97/01442 



1/4 



An wen dung A 



Anwendung B 




FIG. 1 



wo 97/36250 



2/4 



PCT/EP97/0.U42 




BNOOOaO: 4WO_073026M1JL^ 



.wo 97/36250 



PCT/EP97/01442 



1 

I 



3/4 




'^^ V ^ 

25 24 26 



FIG. 3 



wo 97/36250 



PCT/EP97/01442 



4/4 



Anwendung A ' 







Quelldatei 



Export - 
voriaqe 



O 




Anwendung B 



Import - 
vorlage 



8 

L 



Grob analyse 




Grobanalyse 


Feinanalyse 


Feinanalyse 


Subarialyse 


Subanalyse 






Analyse VA 


i \ 


Analyse VB 









I 

I Analyse 
, phase 



I 

I 



. I 



I 



Zieldafei 
7 



I 

! Verkniipfungs- 
phase 



I 4 



<T) 



J 
"1 



Syn these ■ 
phase 



FIG. 4 



BMSDOCtO: <WD_fl73eafiOA1JL> 



wo 97/36250 PCT/EP97/01442 
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Verfahren zur Datenkonveirtierung 

10 

Die Erfindung betrifft ein Verfahren zutn Konvertieren von Daten 
zwischen zwei Anwendungen beziehungsweise Sof twarepaketen, die 
unterschiedliche Datenf ormate benutzen, nach dem Oberbegriff 
des Patentanspruches 1. 

15 

Der Erfindung liegt das grundsatzliche Problem der Inkompatibi- 
litat von Daten aus verschiedenen Anwendungen bzw. Softwarepa- 
keten zugrunde. Viele Programme besitzen ein eigenes Datenf or- 
mat fur die interne Verarbeitung der Daten. Dieses ist aber nur 

20 selten von anderen Programmen zur Weiterverarbeitung einlesbar. 
Der Anwender steht vor dem Problem, beliebige Daten von Anwen- 
dung A nach Anwendung B zu transportieren, wobei ihm im allge- 
meinen die Datenf ormate der Anwendungen A und B nicht bekannt 
sind. Bei den zu transportierenden Daten handelt es sich meist 

25 um Datenbanken, es konnen aber auch im weitesten Sinne Anwen- 
dungsdaten auf treten, wie zum Beispiel Textdateien, CAD-Daten, 
Sound- Formate, Kalkulationsprogramme und andere, 

Um den vorstehend beschriebenen Datentransf er realisieren zu 
30 kdnnen, bieteh modeme und flexible Programme die Moglichkeit, 
Daten der gangigsten Formate einzulesen und in ihrem eigenen 
Format weiterzuverarbeiten, Um einen Austausch zwischen ver- 
schiedenen Anwendungen, beispielsweise auch von anderen Be- 
triebssystemen, zu ermoglichen, ist bei einigen Sof twarepaketen 
35-* eine Im- und Exportf unktion im ASCII -Format oder einem anderen 
gangigen Format vorgesehen. 
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Dariiberhinaus gibt es viele Hilf sprogramme, die Datenkonvertie- 
rungen von einetn Format A nach einem Format B erlauben. Diese 
haben einen fest vorgegebenen Konvertierungsalgorithmus imple- 
mentiert, welcher der jeweiligen Anwendung entspricht . Der An- 
5 wender kann nun wahlen, zwischen welchen Datenf ormaten A und B 
das Programm eine Konvertierung durchfuhren soil. Diese Hilfs- 
programme konnen teilweise die Art der Datei bzw. die Art der 
Anwendung A automatisch anhand von einfachen spezif ischen Merk- 
malen bei der Datelform, wie zum Beispiel der Dateiform und fe- 
10 sten Inf ostrukturen und Versionskennungen innerhalb der Datei, 
erkennen . 

Ein spezielles Verfahren zur Datenkonvertierung ist bereits aus 
der DE 41.28 940 Al bekannt . Mit Hilfe dieses Verfahrens werden 

15 druckaufbereitete digitale Daten eines mit einer Text- und/oder 
Graphik- Software am Bildschirm einer Datenverarbeitungsanlage 
erstellten Dokumentes in f aksimilespezif ische Ubertragungsdaten 
konvertiert. Dieses Verfahren ersetzt die umstandliche, zeit- 
aufwendige und f ehlerbehaf tete Methode, ein am Bildschirm einer 

20 Datenverarbeitungsanlage erstelltes Dokument an einem an der 
Datenverarbeitungsanlage angeschlossenen Drucker auszudrucken 
und anschliefiend das auf Papier gedruckte Dokument durch eine 
optoelektronische Einheit eines Faksimilegerates abzutasten. 
Die Abtastdaten der optoelektronischen Einheit werden dann fak- 

25 similespezif isch codiert und iibertragen. 

Sowohl die in den Anwendungen integrierten Konvertierung spro- 
gramme als auch die eigenstSndigen Hilf sprogramme zur Datenkon- 
vertierung haben beide den Nachteil, daS nur eine begrenzte 

30 Auswahl an Datenf ormaten zur Verfiigung gestellt wird, die mit 
den festen Algorithmen des Programmes konvertiert werden kon- 
nen. Diese Konvertierungen berucksichtigen in der Regel nicht 
die Element inhalte und deren Verknupf ungen, wie beispielsweise 
Zeicheninhalt und Zeichenlange, sprachliche Aspekte, Existenz- 

35" regeln, Elementumf ormungen, Sprachraum, Elementmuster und Ele- 



ment interpretation. AuSerdem sind die meisten Datenf ormate 
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nicht sehr gut standaxdisiert , und viele Anwendungen bringen 
ihre eigenen Datenstrukturen ein. Die Datenelemente sind fur 
die Quellanwendung optimiert und kdnnen bei der Zielanwendung 
Fehler bei der Verarbeitung verursachen, die aufwendig vom An- 
5 wender von Hand korrigiert werden mussen Oder sogar eine Wei- 
terverarbeitung der Daten unmoglich machen. 

Es ist Aufgabe der Erf indving, dem Anwender ein Verfahren zur 
Datenkonveirtieirung zur Verfugung zu stellen, das eine flexible 
10 Datenangleichung von verschiedenen Anwendungsprogranmien mit 
relativ einfachen Micteln ermoglicht, 

Diese Aufgabe ist erf indungsgemalS durch die Merkmale des Pa- 
tentanspruchs 1 gelSst. 

15 

Erf inderische Weiterbildungen und Ausgestaltungen der Erf indung 
sind in den Unteranspriichen beschrieben. 

Die erf indungsgemafie Konvertierungs software ist dabei in der 
20 Lage, Daten eines beliebigen Formates A in Daten eines beliebi- 
gen Formates B halb- und auch vollautomatisch zu transf erieren, 
wobei im Prinzip keine Einschrankung beziiglich der moglichen 
Datenformate auftritt. Da die Datenformate A und B von der er- 
f indungsgemfiiBen Konvertierungssof tware uber die Grobstruktur 
25 der Daten hinaus sowohl halb- als auch vollautomatisch in deren 
Feinstruktur analysiert werden, ist die mogliche Fehlerquote 
beim Datentransfer von Anwendung A nach Anwendung B deutlich 
geringer als bei den ublichen Hilf sprogrammen . Zusatzlich sind 
Datenveranderungen und Datenanpassungen in diversen Ebeneh, 
30 beispielsweise in der Datei- / Satz- , Elementebene und weitere, 
vorgesehen, um die Fehlerquote bei der Zielanwendung zu verrin- 
gem. 

Der Aufbau des erf indungsgemdfien Verfahrens zur Datenkonver- 
35" tierung ist in der Zeichnung dargestellt und nacchstehend er- 
lautert . Darin zeigen: 
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Fig. 
Fig. 

5 Fig. 

Fig . 

10 Die Pigur 1 zeigt in Form eines Inf ormationsablaufdiagratnmes 
den Ablauf eines Datentransf ers mit Hilfe des erf indungsgemafien 
Verfahrens bzw. der erf indungsgemcLfien Konvertierungs software 
(1). Bin Ariwender mochte beliebige Quelldaten Q (2), die von 
der Anwendung A (3) erzeugt und export iert werden, zur Anwen- 

15 dung B (4) transportieren, urn sie dort weiterzuverarbeiten. 
Jede der Anwendungen A (3) und B (4) kann ihre Daten in einetn 
fur sie selbst verstandlichen Format im- und exportieren; dies 
ist in den Anwendung (3) und (4) implement iert , um Daten zwi- 
schen Anwendungen der gleichen Art auf verschiedenen Arbeit s- 

20 platzen auszutauschen . 

Der Anwender kann nun jeweils einen Probeexport von beispiels- 
weise etwa 500 DatensStzen aus dem Datenbestand der Anwendung 
A (3) und dem der Anwendung B (4) erzeugen. So entstehen das 

25 Vorlagefile VA (5) aus Anwendung A (3) und Vorlagefile VB (6) 
aus Anwendung B (4) . Voraussetzung fur das Funktionieren des 
Verfahrens zur Datenkonvertierung ist daLbei, dafi die Anwendung 
B (4) ihr eigenes, von ihr erzeugtes, exporttiertes Vorlagefile 
VB (6) wieder import ieren kann, was aber selbstverstandlich 

30 funktionieren sollte . Jetzt konnen die Vorlagefiles VA (5) und 
VB (6) mittels der Konvertierungssof tware (1) analysiert werden 
(7). 

Es ware grundsatzlich auch ein Datenaustausch von Anwendung A 
35" (3) zu Anwendung B (4) direkt moglich ohne den Weg viber die 
Datei (zum Beispiel OLE, DDE und weitere) zu gehen, Hier wird 




1 das Inf ormationsablauf diagramm des Verfahrens 
zum Datentransf er; 

2 ein Diagramm zur Strukturanalyse des Verfahrens 
mit detail! iert em Strukturaufbau; 

3 den Syntheseverlauf des Verfahrens fiir die Bil- 
dung der Daten B aus den Daten A; 

4 das Inf ormationsablauf diagramm gemaS Figur 1 in 
detaillierterer Darstellung. 
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dann also der Umweg liber die Dateien gespart, wahrend die Ana- 
lyse- und Verknupfungsprozesse naturlich wirksam bleiben sind. 

Da der Anwender im allgemeinen nichts tiber den Aufbau der Da- 
5 tenstrukturen und uber die Datenstrukturen der Anwendungen A 
(3) und B (4) weiS, und daruber auch nichts wissen mochte, sind 
fxir die Analyse komplexe Algorithmen erf orderlich, urn den An- 
wender moglichst von Entscheidungen zu entlasten und den Analy- 
se- und VerknupfungsprozeS (8) zu automat isieren Oder zumindest 

10 zum Teil zu automatisieren . Die implement ierten Algorithmen 
konnen problemlos erveitert werden, um auch neue, in Zukunft 
auftretende Datenstrukturen analysieren zu konnen. Der Umfang 
der Analyse (8) der Strukturenwird weiter unten anhand von Fi- 
gur 2 naher erlautert . Nach dem Analyse- und Verknupf ungsprozefi 

15 (8) kennt die Konvertierungssof tware (1) die Datenstruktur der 
Vorlagefiles VA (5) und VB (6) und auch die notwendigen Ver- 
knupf ungen zwischen den Elementen der Vorlagefiles VA (5) und 
VB (6) . Dieses Konvertierungsmuster fur die Ubertragung der 
Daten von Anwendxing A (3) nach Anwendung B (4) wird als Muster- 

20 ablauf datei M abgespeichert . 

Will der Anwender zu einem sp^teren Zeitpunkt weitere Daten- 
transfers zwischen denselben Anwendungen A (3) und B (4) wie 
oben erlautert durchfuhren, so ist es moglich, das eben ermit- 

25 telte Konvertierungsmuster in Form von Musterablauf daten M (9) 
abzuspeichem (10) . Somit eriibrigt sich fur den Anwender beim 
n^chsten KonvertierungsprozeS die Erzeugung der Vorlagefiles VA 
(5) und VB (6), und die Konvertierungssof tware (1) kann beim 
Datentransf er bhne AnalyseprozeB (8) direkt auf die gesicherten 

30 Musterablauf daten M (9) zuruckgreif en und die Musterablauf daten 
M (9) wieder einlesen (10) . 

Wie dazu insbesondere Figur 4 in Erganzung zu Figur 1 zeigt, 
unterteilt sich die Aiialysephase sowohl des Vorlagefiles VA (5) 
35" als auch des Vorlagefiles VB (6) in eine Grobanalyse, eine fol- 
gende Feinanalyse, eine weitere folgende Subanalyse und so wei- 
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ter, um schliefilich im Ergebnis zur Endanalyse zu gelangen. An 
die Analysephase schliefit sich dann die VerJcnupfungsphase an, 
in welcher die Analysen der Vorlagefiles verkniipft werden. 

5 In der Synthesephase (11) wird mit Hilfe des ermittelten Analy- 
se- und Verknupfungsergebnisses eine Konvertierung der Quellda- 
ten Q (2) in die Zieldaten Z (12) erreicht . Im letzten Schritt 
kann die Anwendung B (4) die Zieldaten Z (12) importieren, da 
sie in dem von der Anwendung B (4) im- und export ierbaren Da- 
10 tenforttiat vorliegen, und weiterverarbeiten. 

Bei diesem erf indungsgemafien Verfahren zur DatenJconvertierung 
ist es fiir den Benutzer zudem moglich, durch Verwendung von vom 
Benutzer definierten Sonderregeln bei der Synthese (11) der 

15 Quelldaten Q (2) in die Zieldaten Z (12) Datenveranderungen 
vorzunehmen. Als Beispiele, und keineswegs vollstandig aufge- 
zahlt, seien hier nur der Ersatz von a, 6, vi durch ae, oe ue 
und die Umbildung der Elemente [Sehr geehrter] und [Herr xyz] 
in die Elemente [Sehr geehrter Herr] und [xyz] genannt • Es sind 

20 hierbei naturlich auch sehr komplexe Datenveranderungen mog- 
lich, die am besten mit dem Begriff des "Morphing" aus der 
Bildverarbeitung verglichen werden konnen, der die Wandlung von 
einem Muster A nach Muster B ohne Inf ormationsverluste be- 
schreibt . 

25 

Wie Figur 1 zeigt, wird die zu export ierende Quelldatei (28) 
der Anwendung A (3) in die Quellanalyse (29) gegeben. Nach er- 
folgter Analyse fur automatische Regelbildung und Verknupfungen 
im Block (8) wird die Zielanalyse (11) erstellt. Die konver- 

30 tierten Daten werden sodcum in die import ierbare Zieldatei (30) 
gegeben. Bei dem Vorgang des Exportierens der Quelldatei (28) 
in die Zieldatei (11) mittels der Musterablauf daten M ist eine 
Quell- Oder Zielanalyse nicht mehr erf orderlich . Auch die Re- 
gelbildung und die Verknupfungen wurden in diesem Fall bereits 

3 5- mit den Vorlagefiles VA (5) und VB (6) erzeugt . Bei der Synthe- 
se wird die Quelldatei Q (2) gelesen und mit dem Datenfilter 
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aus den Musterablauf daten M bearbeitet . Die generierten Daten- 
satze werden in die Zieldatei geschrieben. Das Datenfilter kann 
sich externer Dateien zum Abgleich wie auch interner Dateien 
zum Suchen und Sortieren bedienen. 

5 

In Figur 2 ist ein Diagramm dargestellt, welches den Struktur- 
aufbau einer allgemeinen Datentransf erdatei in detaillierter 
Form zeigt. Die Analyse (8) der Vorlagefiles VA (5) und VB (6) 
unterceilt sich in mehrere Phasen. Ausgehend von dem ersten Er- 

10 kennen der Grobstruktur (13) wird die Dateiform wie bei bisher 
bekannten Konvertierungsprogrammen zunachst vorklassif iziert . 
Die intelligente Konvertierungssof tware stellt nun zus^tzlich 
einen Satz von Algorithmen zur Verfugung, der in der Lage ist, 
automatisch die Feinstruktur (14) der vorliegenden Daten zu er- 

15 kennen. Die Analyse (8) wird f ortgef lihrt , um auch die Substruk- 
turen (15) innerhalb der Datenelemente (17) zu erkennen. 

Wie auch gut erkennbar aus Figur 3 hervorgeht, dient die Grob- 
struktur (13) dem Erkennen der Filestruktur , der Trennzeichen, 
20 der Elementbezeichner, der Zeichenlinge usw. im. Dateiraum und 
im Satzraum (16) . In der Grobstruktur (13) werden Dateien nach 
ihrer Dateiform unterschieden. Die Unterschiede sind zum Bei- 
spiel anhand von Dateiendungen oder Inf ostrukturen innerhalb 
der gesamten Datei zu erkennen. 

25 

Die Feinstruktur (14) dient dem Erkennen von Elementexistenz , 
Element -Zeicheninhal ten. Element zeichenlSnge usw. wie Elemen- 
traum (19) und Zeichenraum (20). Die . Feinstruktur (14) bezieht 
sich auf die Satzebene, die den Aufbau eines einzelnen Daten- 

30 satzes im sogenannten. Satzraum (16) aus den Elementen (17), 
sowie die Verkniipf ungen der Satzelemente (17)^ untereinander , 
den sogenannten Satzregelraum (18) beinhaltet. Bei der Merk- 
malsfindung fur den Datensatzaufbau . und die Datensatzstruktur 
werden beispielsweise Feldnamen in einem Datensatz (16) analy- 

25- siert, die Verwendung spezieller Trennsymbole fur Elemente (17) 
und Datensatze (16) , die Verwendung von Start- und Stopsymbolen 
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fvir die Strukturierung. innerhalb der Elemente (17) und die An- 
zahl der Elemente (17) pro Datensatz (16) ermittelt. 

Die Substruktur (15) dient dem Erkennen von Worten \ind Subele- 
5 menten mit Sub-Trennern in den einzelnen Elementen, wie Elemen- 
traum (19) , Zeichenrautn, Wortraum. Die Substruktur unterglie- 
dert sich also nochmals in die Elementebene, dem Elementraum 

(19) , und die Zeichenebene, dem Zeichenraum mit Zahlenraum 

(20) , In der Elementebene (19) werden die Existenzmerkmale fur 
10 ein Element (17) festgelegt. 

Als Existenzmerkmale treten zum Beispiel auf : minimale und 
maximale Datenelement-Zeichenlange, Datenelement-Existenzvor- 
gaben (mufi, kann, darf ) , zulassige und vorkommende Zeichen in 
15 einem Datenelement (17) , vervendeter Sprachraum, begrenzte Li- 
stenstrukturen innerhalb von Datenelementen (17) , Wortanalysen, 
etc. . Die Zeichenebene (20) gibt die moglichen AuswahlrSume fur 
Zahlen, Buchstaben, Sonderzeichen, GEM-Zeichen und amdere vor. 

20 So kann zum Beispiel das Element "Arb.Zeit" einen 

1. Satz: "Meier/Muller/Graf /Kemper" , einen 

2. Satz: "8h /7H /9h /8h" und einen 

3. Satz: "5H /9h /llh /7h enthalten. 

25 Demzufolge gibt es in dem Element "Arb.Zeit" offenbar Substruk- 
turen, die durch das Zeichen getrennt sind. Solche und Shn- 
liche Substrukturen werden erkannt und bei der Analyse wie zu- 
satzliche Elemente mit Bezeichner, namlich Meier, Muller, Graf, 
Kemper, und entsprechenden Inhalten behandelt. 

30 

Wie oben an cuiderer Stelle bereits ausgefuhrt, enhalt das Ele- 
ment "Anrede" mehrere Worter: 

1. Satz: "Sehr geehrter Herr", 

2. Satz: "Sehr geehrte Frau", 
3S" 3. Satz: "Hallo, Herr" und 

4. Satz: "Sehr geehrter Herr Dipl.-Ing". 
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Diese Siibstrukturen werden als Worter in. Wortlisten ubernommen 
und gegebenenf alls einzeln weiter nach zusaczlichen Mustern und 
Regeln analysiert . 

1 Zur Verdeutli Chung dient ein weiteres Beispiel . Das Element 
"Strasse" enthalt die Muster 

1. Satz: "Hofweg 13", 

2. Satz: "Am langen Kant 77" und 

3. Satz: "Bremer Strasse 19". 

Diese Substrukturen (15) werden als Worte analysiert und nach 
Mustern untersucht. Es konnen so ziim Beispiel Strassenname und 
Hausnummer gesplittet werden. 

15 Von groSer Wichtigkeit ist es, daS sich die Substmkturen (15) 
auf Objekte in einer Ebene unter den Satzelementen beziehen. 
Hier werden die Element inhalte nach weiteren Mustern abgesucht . 



10 



Bei der Musterstruktur werden mit den vorgenannten Analyse- 
20 Ergebnissen die Muster- und Verknupfungsanalysen durchgefuhrt 
(Satzraum (16), Satzregelraum, Elementraum (19), Wortraum) . 
Dabei werden ubergreif ende Muster und Regeln mittels fester 
Algorithmen und neuronaler sowie Fuzzy-Algorithmen bestimmt . 

Um die Mustererkennung bei der sprachlichen Analyse (8) von 
Feinstruktur (14) und Substiruktur (15) moglichst automatisch 
ablaufen lassen zu konnen, ist bei den Algorithmen die Verwen- 
dung modemer Techniken, wie neuronale Netze und Fuzzy-Logik 
neben festen Algorithmen, erf orderlich, LaSt man solche Ansatze 
weg, so muS der Anwender eventuell einzelne Verkniipfungen von 
Hand durchftihren. . 

Die Figur 3 zeigt in Diagrammform nun den Syntheseverlauf (11) 
fiir die Bildung der Datenelemente (21) fur die Anwendung B (4) 
33- aus den Datenelementen (22) der Anwendung A (3) Aus der oben 
beschriebenen Analyse (8) der Vorlagefiles VA (5) und VB (6) 



25 



30 
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ergibt sich ein Datenfilter (23), der die zuvor ermittelten 
Verkniipfungsregeln (24) zwischen den Datenelementen (21) und 
(22) enthalt. Schickt man die Datensatze (25) aus der Anwendung 
A (3) durch diesen Datenfilter (23). so erhalt man neue Daten- 
5 satze (2 6) mit neuen Datenelementen (21) , die in einem von der 
Anwendung B (4) im- und export ierbar en Datenformat vorliegen. 
Die Anzahl der Datenelemente (22) der DatensStze (25) aus der 
Anwendung A (3) ist nicht unbedingt gleich der Anzahl der Da- 
tenelemente (21) der Datensatze (26) fur die Anwendung B (4) , 
10 die Anzahl der Datensatze (25) und (26) ist im allgemeinen fvir 
beide Anwendungen A (3) und B (4) gleich. 

Zusatzlich zu dem aus der Analyse (8) der Vorlagefiles VA (5) 
und VB (6) entstandenen Datenfilter (23) fur den Datentransf er 

15 von Anwendung A* (3) nach Anwendung B (4) ist auch ein Abgleich 
der Datenelemente (21) und (22) mit einer extemen Datenbank 
Oder mehreren extemen Datenbanken (27) mdglich, beispielsweise 
auch die Mischung von mehreren Datenbanken, wie Kundendatei + 
Rechnungsdatei , Mit einem solchen extemen Abgleich konnen zum 

20 Beispiel die Postleitzahlen der Datensatze (25) und (26) kon- 
trolliert werden, indem man die Datenelemente (21) und (22) von 
Land, Stadt, Strafie und Postleitzahl mit denen der extemen Da- 
tenbank (27) vergleicht- 

25 Zusatzlich ist das Anlegen einer Oder mehrerer intemer Zwi- 
schendatenbanken zum Suchen und Sortieren auf Dateiebene mog- 
lich. Dies ist erf orderlich, um ein schnelles Suchen und Sor- 
tieren, beispielsweise nach dem Alphabet Oder speziellen Merk- 
malen, zu ermoglichen. 

30 
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5 

Patentanspruche 

10 1. Verfahren zur Konvertierung von Daten und nicht-dateibezo- 
genen Methoden zwischen zwei Anwendungen bzw, Sof twarepaketen, 
die zueincuider unterschiedliche Datenf ormate benutzen, 
dadurch gekennzeichnet , 

daS aus dem Datenbestand der ersten Anwendung A (3) und dem Da- 
15 tenbestand der .zweiten Anwend\ing B (4) jeweils ein Probe-Export 
von Datensatzen relativ geringer Menge erzeugt wird, aus denen 
ein Vorlagefile VA (5) aus Anwendung A (3) und ein Vorlagefile 
VB (6) aus Anwendung B (4) gebildet werden, von denen die An- 
wendung B (4) das von ihr erzeugte Vorlagefile VB (6) wieder 
20 itnportieren kann, dafi die Vorlagesf iles VA (5) und VB (6) zur 
Ermittlung ihrer Datenstrukturen und gegebenenf alls zur Ermitt- 
lung der Verkniipf ungen zwischen den Elementen durch eine Kon- 
vertierungssof tware (1) analysiert werden, und daE die Quell- 
daten Q (2) mit Hilfe der Analyseergebnisse in die Zieldaten Z 
25 (12) konverciert werden, welche von der Anwendung B (4) impor- 
tiert werden. 

2. Verfahren nach Anspruch 1, 
dadurch gekennzeichnet , 
30 daS das Analyse -Ergebnis als Konvertierungsmuster fur die Uber- 
tragung der Daten des ersten Anwenders A (3) zum zwei ten Anwen- 
der B (4) in Form von Musterablauf daten M (9) abgespeichert 
wird- 

35 3. Verfahren nach Anspjruch 1, 
dadurch gekennzeichnet, 
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daS die Quelldaten Q.(2)., nach Durchlauf der Analyse (8) und 
Verknupfung in eine Zielsynthese (11) gegeben werden, von der 
sie in die Zieldaten Z (12) konvertiert werden. 

5 4, Verfahren nach einem der Anspruche l bis 3, 
dadurch gekennzeichnet , 

dafi die Analyse (8) der Vorlagefiles VA (5) und VB (6) in 
mehrere, insbesondere drei Phasen unterteilt ist, wobei nach 
dem Erkennen der Grobstruktur (13) die Dateiform zunachsc 
10 vorklassif iziert wird, anschlieSend durch die Konvertierungs- 
software ein Satz von Algorithmen zur automat is chen Erkennung 
der Feins truktur (14) zu VerfQgung gestellt wird und schlieS- 
lich in Fortfiihrung der Analyse die Substrukturen (15) inner- 
halb von Datenelementen (17) erkannt werden. 



15 



20 



5 . Verf ahren nach Anspruch 4 , 
dadurch gekennzeichnet , 

daS in der Grobstruktur (13) die Dateien nach ihrer Dateiform 
unterschieden werden. 



6 . Verfahren nach Anspruch 4 , 
dadurch gekennzeichnet , 

dafi sich die Feinstruktur (14) auf die Satzebene bezieht, die 
den Aufbau eines Satzes (16) aus Elementen (17) und die Ver- 
25 knupfungen der Satzelemente (17) untereinander beinhaltet. 

7. Verfahren nach Anspruch 4, 
dadurch gekennzeichnet , 

daS die Substruktur (15) sich in die Elementebene (19) und in 
30 die Zeichenebene (20) mit Zeichenraum und Zahlenraum unter- 
gliedert, wobei in der Elementebene (19) die Existenzmerkmale 
fur ein Element (17) festgelegt werden. 

8. Verfahren nach einem der vorgenannten Anspruche, 
35* dadurch gekennzeichnet , 

daS bei den Algorithmen fur die Mustererkennung der sprachli- 
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Chen and logischen Analyse (8) die Technologien der neuronal en 
Net 26 und/oder der Fuzzy-Logik eingesetzt werden. 

9, Verfahren nach einem der vorgenannten Anspruche, 
5 dadurch gekennzeichnet , 

daS aus der Analyse (8) der Vorlagefiles VA (5) und VB (6) ein 
Datenfilter (23) gebildet wird, der die Verknuf ungsregeln (24) 
zwischen den Datenelementen (21,22) auf der Dateiebene Oder zu- 
sammen mit einer oder mehreren extemen Datenquellen (Abgleich) 
10 aufweist, wobei nach Durchlauf von Datensatzen (25) aus der An- 
wendung A (3) durch den Datenfilter (23) neue DatensStze (26) 
mit neuen Datenelementen (21) erhalten werden, die in einem von 
der Anwendung B (4) im- und export ierbaren Datenformat vor- 
liegen . 

15 

10, Verfahren nach einem der vorgenannten Anspruche, 
dadurch gekennzeichnet , 

dafi die Datenelemente (21,22) mit einer extemen Datenbank (27) 
abgleichbar sind. 

20 

11, Verfahren nach einem der vorhergehenden Anspriiche, 
dadurch gekennzeichnet , 

dafi eine oder mehrere interne Zwischendatenbanken zur Suche und 
Sortierung von DatensStzen eingerichtet wird bzw. werden. 



30 



35 
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